查看原文
其他

从天龙八部小说衍生出的google语义分析与gephi社交网络

2017-12-18 zhaikun Python爱好者社区

作者:zhaikun   风控建模屌丝一枚,现居于北京

个人微信公众号:Python数据分析与评分卡建模

联系方式:664086823@qq.com

数据和图获取方式:关注Python爱好者社区后回复 天龙八部


最近迷上了可视化,周末在家好好学了echarts与python+echarts的集合pyecharts,还有gephi。感兴趣的小伙伴可以看看。


忠告下,MAC下的gephi是大坑,windows下的pyecharts也稍微有点坑。

本文主要提供一个思路,把分析结果展示给大家,抛砖引玉。


================================分割线===============================

直接打开分过次的天龙八部(已上传)


jiabe tf_idf 分析,提取出最重要的100个词,这里只打印前10个词



萧峰和乔峰分别位于第2和第3呀,加起来第1哟,段誉当之无愧的第二,大家记好段誉这个名字,后面会对他进行相似度分析。至于虚竹是谁?虚竹?好像听过这个名字。。。


python一个好玩的包是词云,像不像大字报?上图



下面上google的word2vec


先分析阿朱、阿紫的相似度


再看与段誉最相似/相关的


出来了木婉清、王语嫣。嘿嘿,段誉别装了,就是木婉清了!


继续,老规矩的Python社交网络分析



上次很多小伙伴留言要我的社交网络画图法,这次我就一并放上吧,但是对于大数据下的社交网络,建议用gephi或别的可视化工具。



这个图是什么?看不懂!

下面上gephi图:



好吧,天龙八部大人可以好好分析了,主意,萧峰与乔峰有不同的社交网络哟!


数据和图获取方式:关注Python爱好者社区后回复 天龙八部

Python爱好者社区历史文章大合集

Python爱好者社区历史文章列表(每周append更新一次)

福利:文末扫码立刻关注公众号,“Python爱好者社区”,开始学习Python课程:

关注后在公众号内回复“课程”即可获取:

0.小编的Python入门视频课程!!!

1.崔老师爬虫实战案例免费学习视频。

2.丘老师数据科学入门指导免费学习视频。

3.陈老师数据分析报告制作免费学习视频。

4.玩转大数据分析!Spark2.X+Python 精华实战课程免费学习视频。

5.丘老师Python网络爬虫实战免费学习视频。

您可能也对以下帖子感兴趣

纪念金庸先生诞辰100周年|向来痴,从此醉
卫星活动 | AI部署新手福音!免费报名来学AI新技术
如果没有段誉,王语嫣的命运只会更苦
为爱而生 | 如果没有段誉,王语嫣的命运只会更苦
有书真好啊!【140】《天龙八部》

文章有问题?点此查看未经处理的缓存